Visualisasi data adalah proses menyajikan data dalam bentuk visual, seperti grafik, diagram, peta, atau tabel interaktif, untuk mempermudah pemahaman, analisis, dan pengambilan keputusan. Tujuan utama dari visualisasi data adalah untuk mengungkap pola, tren, hubungan, atau wawasan yang mungkin sulit ditemukan dalam data mentah atau angka-angka. Dengan kata lain, tujuan visualisasi data adalah untuk mengubah data menjadi wawasan yang dapat diakses dan digunakan oleh siapa saja, baik untuk analisis, komunikasi, maupun pengambilan keputusan.
Visualisasi Data memiliki berbagai macam grafik yang umum digunakan, Nah berikut ini adalah berbagai macam grafik yang umum digunakan dalam visualisasi data, beserta penjelasannya:
Grafik Univariat digunakan untuk menganalisis satu variabel saja. Grafik ini memberikan informasi tentang distribusi atau frekuensi data dalam satu dimensi.
Contoh sederhana cara Membuat Grafik Histogram:
#Pertama membaca file .xlsx menggunakan readxl
#Jika belum menginstall bisa install di packages
library(readxl)
Data <- read_excel("Data.xlsx")
View(Data)
# Muat library ggplot2
library(ggplot2)
# Lalu buat plot Histogram
ggplot(data = Data, aes(x = Jumlah_anak)) +
geom_histogram(binwidth = 1, color = "black", fill = "lightblue",linetype = "solid")+
labs(title = "Histogram", x = "Jumlah Anak")
Keterangan:
ggplot(): Fungsi utama dari ggplot2 untuk membuat
grafik.data = Data: Menentukan sumber data yang akan digunakan
(data frame bernama Data).geom_histogram(): Menambahkan elemen histogram ke
plot.labs(): Digunakan untuk memberikan label pada
grafik.Grafik Bivariat digunakan untuk menganalisis hubungan antara dua variabel. Grafik ini berguna untuk melihat apakah ada korelasi atau asosiasi antara dua variabel.
Contoh sederhana cara Membuat Grafik Barchart:
#Pertama membaca file .xlsx menggunakan readxl
#Jika belum menginstall bisa install di packages
library(readxl)
Data <- read_excel("Data.xlsx")
View(Data)
# Muat library ggplot2
library(ggplot2)
# Lalu buat plot Histogram
ggplot(data = Data, aes(x = Jumlah_anak, y = Benua, fill = Benua)) +
geom_bar(stat = "identity") +
labs(title = "Rata-rata Jumlah Anak tiap Benua", x = "Jumlah Anak", y = "Benua") +
theme_minimal()
Keterangan:
ggplot(): Membuat plot dasar menggunakan dataset
Data.aes(): Mendefinisikan elemen estetika pada grafik.geom_bar(): Membuat grafik batang (bar chart).labs(): Menambahkan label pada grafik.theme_minimal(): Memberikan tema minimalis pada
grafik(tampilan yang bersih tanpa banyak garis dan warna).Contoh sederhana cara Membuat Grafik Linechart:
#Pertama membaca file .xlsx menggunakan readxl
#Jika belum menginstall bisa install di packages
library(readxl)
Data <- read_excel("Data.xlsx")
View(Data)
# Muat library ggplot2
library(ggplot2)
# Lalu Membuat line chart
ggplot(data = subset(Data, Negara == "Afghanistan"), aes(x = Tahun, y = Angka_Harapan_Hidup)) +
geom_line(linewidth = 1, color = "blue") +
labs(title = "Perubahan Angka Harapan Hidup di Afghanistan",
x = "Tahun",
y = "Angka Harapan Hidup") +
theme_minimal()
# Mencoba pada tiap Benua
ggplot(data = Data, aes(x = Tahun, y = Angka_Harapan_Hidup)) +
geom_line(aes(color = Benua), linewidth = 1) +
facet_wrap(~Benua) +
labs(title = "Perubahan Angka Harapan Hidup Tiap Benua",
x = "Tahun",
y = "Angka Harapan Hidup",
color = "Benua") +
theme_minimal()
Keterangan
ggplot(): Membuat plot dasar menggunakan dataset
Data.aes(): Mendefinisikan elemen estetika pada grafik.geom_line(): Membuat grafik garis (line chart).labs(): Menambahkan label pada grafik.facet_wrap(): Digunakan untuk membuat plot yang memecah
data berdasarkan satu atau lebih variabel kategori.theme_minimal(): Memberikan tema minimalis pada
grafik(tampilan yang bersih tanpa banyak garis dan warna).Grafik Multivariat digunakan untuk menganalisis lebih dari dua variabel. Grafik ini membantu melihat pola, hubungan, atau tren yang melibatkan lebih dari dua variabel sekaligus.
Contoh Sederhana Cara Membuat Grafik 3D Scatter Plot:
#Pertama membaca file .xlsx menggunakan readxl
#Jika belum menginstall bisa install di packages
library(readxl)
Data <- read_excel("Data.xlsx")
View(Data)
# Muat Library plotly
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
# Membuat 3D scatter plot
plot_ly(data = Data,
x = ~Pendapatan_per_kapita,
y = ~Angka_Harapan_Hidup,
z = ~Jumlah_anak,
type = "scatter3d",
mode = "markers",
color = ~Benua, # Warna berdasarkan benua
size = ~20, # Ukuran titik
text = ~Negara) # Menambahkan nama negara sebagai tooltip
Keterangan:
library(plotly): Memuat pustaka plotly yang digunakan
untuk membuat grafik 3D.plot_ly(): Untuk membuat plot interaktif.type = "scatter3d": Menentukan jenis plot sebagai
scatter plot 3D.mode = "markers": Menentukan bahwa grafik ini akan
menampilkan titik-titik data (markers).color = ~Benua: Menentukan warna titik-titik dalam
grafik akan ditentukan berdasarkan variabel Benua.size = ~20: Menentukan ukuran titik.text = ~Negara: Menambahkan nama negara sebagai tooltip
yang akan muncul ketika pengguna mengarahkan kursor ke titik
tertentu.Contoh Sederhana Cara Membuat Grafik Heatmap:
# Muat library ggplot2
library(ggplot2)
# Membuat Heatmap
ggplot(Data, aes(x = Tahun, y = Benua, fill = Angka_Harapan_Hidup)) +
geom_tile() +
scale_fill_gradient(low = "yellow", high = "brown", name = "Angka\nHarapan\nHidup") +
labs(title = "Heatmap Angka Harapan Hidup Berdasarkan Benua dan Tahun",
x = "Tahun",
y = "Benua") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Keterangan
ggplot(): ggplot digunakan untuk membuat plot
menggunakan data dari objek Data.geom_tile(): Untuk membuat visualisasi berbentuk tile
(ubin) setiap ubin akan memiliki warna berdasarkan nilai
Pendapatan_per_kapita.scale_fill_gradient(): Fungsi ini mengatur skala warna
untuk heatmap.geom_hline(): Menambahkan garis horizontal (hline) pada
plot.theme(axis.text.x): Menyesuaikan tampilan teks pada
sumbu X.Grafik Interaktif memungkinkan pengguna untuk berinteraksi langsung dengan visualisasi, seperti memfilter, memperbesar, atau memilih data tertentu untuk analisis lebih mendalam.
Contoh Sederhana Cara Membuat Grafik Interactive:
#Pertama membaca file .xlsx menggunakan readxl
#Jika belum menginstall bisa install di packages
library(readxl)
Data <- read_excel("Data.xlsx")
View(Data)
# Muat Library plotly dan dplyr
library(plotly)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Membuat grafik interaktif scatter plot
plot <- plot_ly(
data = Data,
x = ~Tahun, # Sumbu X: Tahun
y = ~Pendapatan_per_kapita, # Sumbu Y: Angka harapan hidup
size = ~20, # Ukuran lingkaran
color = ~Benua, # Warna berdasarkan benua
text = ~paste(
"Negara:", Negara,
"<br>Benua:", Benua,
"<br>Populasi:", Populasi,
"<br>Pendapatan per Kapita:", Pendapatan_per_kapita,
"<br>Angka Harapan Hidup:", Angka_Harapan_Hidup),
type = "scatter",
mode = "markers") %>%
layout(
title = "Grafik Interaktif: Tahun vs Angka Harapan Hidup",
xaxis = list(title = "Tahun"),
yaxis = list(title = "Angka Harapan Hidup"),
legend = list(title = list(text = "Benua")))
# Menampilkan plot
plot
Keterangan:
plotly: digunakan untuk membuat grafik interaktif.dplyr: digunakan untuk manipulasi data.plot_ly(): Fungsi utama untuk membuat grafik
Plotlytype = "scatter": Jenis grafik yang digunakan, yaitu
grafik sebar (scatter plot).mode = "markers": Menentukan jenis titik dalam grafik
(markers atau lingkaran).layout(): Digunakan untuk menyesuaikan tampilan
grafik.Plot: Digunakan untuk menampilkan grafik yang sudah
dibuat.Kesimpulan dari Visualisasi Data dengan Berbagai Macam Grafik:
Visualisasi data dengan berbagai macam grafik memberikan insight yang lebih mendalam daripada hanya menggunakan data mentah. Dengan memilih grafik yang tepat dan menyajikan data dengan cara yang mudah dimengerti, kita dapat membuat keputusan yang lebih berbasis pada bukti dan data, yang sangat penting dalam berbagai bidang seperti bisnis, sains, dan pemerintahan.
1. Berbagai Jenis Grafik: Setiap jenis grafik memiliki tujuan dan keunggulan tersendiri, dan pemilihan grafik yang tepat sangat bergantung pada tipe data dan tujuan analisis. Beberapa grafik yang sering digunakan adalah:
Pemilihan grafik harus disesuaikan dengan karakteristik data yang ingin divisualisasikan. Misalnya, scatter plot sangat cocok untuk data yang ingin menunjukkan hubungan antar variabel, sedangkan bar chart lebih cocok untuk data kategori. Line chart ideal untuk data yang berhubungan dengan waktu, sementara pie chart lebih cocok untuk menunjukkan proporsi atau bagian dari keseluruhan.
Visualisasi membantu kita mengenali pola dan tren dalam data yang mungkin tidak langsung terlihat dari angka atau tabel. Ini sangat penting dalam membuat keputusan berbasis data.
Menggunakan Ukuran dan Warna untuk Informasi Tambahan: Dengan memanfaatkan ukuran dan warna, kita bisa menambah dimensi lain dalam visualisasi, seperti menunjukkan volume (misalnya menggunakan ukuran titik dalam scatter plot) atau kategori (misalnya menggunakan warna untuk benua).
Keterbacaan dan Simplicity: Salah satu prinsip penting dalam visualisasi adalah keterbacaan. Grafik harus mudah dimengerti dan tidak berlebihan. Grafik yang terlalu rumit atau penuh dengan informasi akan membingungkan audiens.
Mempermudah Pengambilan Keputusan: Dengan visualisasi yang baik, pengambilan keputusan menjadi lebih mudah dan cepat. Kita bisa melihat hubungan yang tidak langsung terlihat dan merespons masalah atau peluang dengan cara yang lebih efisien.